/**
 * Copyright (c) Huawei Technologies Co., Ltd. 2024-2025. All rights reserved.
 * This file is a part of the CANN Open Software.
 * Licensed under CANN Open Software License Agreement Version 1.0 (the "License").
 * Please refer to the License for details. You may not use this file except in compliance with the License.
 * THIS SOFTWARE IS PROVIDED ON AN "AS IS" BASIS, WITHOUT WARRANTIES OF ANY KIND, EITHER EXPRESS OR IMPLIED,
 * INCLUDING BUT NOT LIMITED TO NON-INFRINGEMENT, MERCHANTABILITY, OR FITNESS FOR A PARTICULAR PURPOSE.
 * See LICENSE in the root of the software repository for the full text of the License.
 */

/*!
 * \file prompt_flash_attention_template_tiling_key.h
 * \brief
 */
#pragma once
#ifndef FIA_ENABLE_MLA
#include "ascendc/host_api/tiling/template_argument.h"

#define ASCENDC_TPL_5_BW 5
#define ASCENDC_TPL_3_BW 3
ASCENDC_TPL_ARGS_DECL(PromptAttention,
    ASCENDC_TPL_UINT_DECL(Q_T, ASCENDC_TPL_4_BW, ASCENDC_TPL_UI_LIST, 0, 1, 2, 3, 4, 5, 6, 7, 8),
    ASCENDC_TPL_UINT_DECL(KV_T, ASCENDC_TPL_4_BW, ASCENDC_TPL_UI_LIST, 0, 1, 2, 3, 4, 5, 6, 7, 8),
    ASCENDC_TPL_UINT_DECL(OUT_T, ASCENDC_TPL_4_BW, ASCENDC_TPL_UI_LIST, 0, 1, 2, 3, 4, 5, 6, 7, 8),
    ASCENDC_TPL_UINT_DECL(PAGE_ATTENTIOND, ASCENDC_TPL_2_BW, ASCENDC_TPL_UI_LIST, 0, 1, 2),
    ASCENDC_TPL_UINT_DECL(LAYOUT_T, ASCENDC_TPL_3_BW, ASCENDC_TPL_UI_LIST, 0, 1, 2, 3, 4, 5),
    ASCENDC_TPL_UINT_DECL(KV_LAYOUT_T, ASCENDC_TPL_3_BW, ASCENDC_TPL_UI_LIST, 0, 1, 2, 3, 4, 5),
    ASCENDC_TPL_UINT_DECL(FLASH_DECODE, ASCENDC_TPL_2_BW, ASCENDC_TPL_UI_LIST, 0, 1),
    ASCENDC_TPL_UINT_DECL(ENABLE_PREFIX, ASCENDC_TPL_2_BW, ASCENDC_TPL_UI_LIST, 0, 1),
    ASCENDC_TPL_UINT_DECL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_3_BW, ASCENDC_TPL_UI_LIST, 0, 1, 2, 3, 4, 5, 6),
    ASCENDC_TPL_UINT_DECL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_4_BW, ASCENDC_TPL_UI_LIST, 0, 1, 2, 3, 4, 5, 6, 7, 8),
    ASCENDC_TPL_UINT_DECL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_4_BW, ASCENDC_TPL_UI_LIST, 0, 1, 2, 3, 4, 5, 6, 8),
    ASCENDC_TPL_UINT_DECL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_3_BW, ASCENDC_TPL_UI_LIST, 0, 1, 2, 3, 4 ,5, 6),
    ASCENDC_TPL_UINT_DECL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_3_BW, ASCENDC_TPL_UI_LIST, 0, 1, 2, 3, 4),
    ASCENDC_TPL_UINT_DECL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_3_BW, ASCENDC_TPL_UI_LIST, 0, 1, 2, 3, 5, 6),
    ASCENDC_TPL_UINT_DECL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_1_BW, ASCENDC_TPL_UI_LIST, 0, 1),
    ASCENDC_TPL_UINT_DECL(P_TEMPLATE_VERSION, ASCENDC_TPL_3_BW, ASCENDC_TPL_UI_LIST, 0, 1, 2, 3, 4),
    ASCENDC_TPL_UINT_DECL(TEMPLATE_MODE, ASCENDC_TPL_2_BW, ASCENDC_TPL_UI_LIST, 0, 1, 2)
);

    ASCENDC_TPL_SEL(        
        //PFA
        #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(  
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 5),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 5),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif

            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionBaseApiTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionBaseApiTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionBaseApiTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(MLAGeneralTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(MLAGeneralTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(MLAGeneralTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 3),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(MLAGeneralTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(MLAGeneralTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 3),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(MLAGeneralTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(MLAGeneralTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 3),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(MLAGeneralTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(MLAGeneralTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 3),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(MLAGeneralTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(MLAGeneralTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 3),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(MLAGeneralTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(MLAGeneralTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 3),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(MLAGeneralTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif  
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_BF16) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 4),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 5),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 7),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 7),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 7),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 5),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 6),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 7),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 7),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 7),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_FLOAT16) && (ORIG_DTYPE_ATTENTION_OUT == DT_FLOAT16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_BF16)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            #if (ORIG_DTYPE_QUERY == DT_INT8) && (ORIG_DTYPE_ATTENTION_OUT == DT_INT8)
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            #endif
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            ),
            ASCENDC_TPL_ARGS_SEL(
                ASCENDC_TPL_KERNEL_TYPE_SEL(ASCENDC_TPL_MIX_AIC_1_2),
                ASCENDC_TPL_UINT_SEL(Q_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(KV_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(OUT_T, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(PAGE_ATTENTIOND, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(KV_LAYOUT_T, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(FLASH_DECODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(ENABLE_PREFIX, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_Q_QUANTMODE_P_MSD_MODE_I_ANTIQUANTMODE, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(M_OUTLAYOUT_P_TAIL_MODE_I_ORIGIN_T, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(M_K_QUANTMODE_P_NEWTILINGFLAG_I_AMLA, ASCENDC_TPL_UI_LIST, 8),
                ASCENDC_TPL_UINT_SEL(M_V_QUANTMODE_P_PRECISION_MODE_I_BALANCE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_UINT_SEL(M_FIAFLAG_P_MMTYPETMP_I_MODEVAL, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_BASE_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_CVDIFF_MLA_FLAG, ASCENDC_TPL_UI_LIST, 0),
                ASCENDC_TPL_UINT_SEL(P_TEMPLATE_VERSION, ASCENDC_TPL_UI_LIST, 1),
                ASCENDC_TPL_UINT_SEL(TEMPLATE_MODE, ASCENDC_TPL_UI_LIST, 2),
                ASCENDC_TPL_TILING_STRUCT_SEL(PromptFlashAttentionTilingData)
            )
);
#endif